Estatística Descritiva

Aulas VI e VIII — Medidas de Posição e Dispersão

Luiz Diego Vidal Santos

Universidade Estadual de Feira de Santana (UEFS)

Estatística Descritiva

O que são

A estatística descritiva é um ramo da estatística que aplica várias técnicas para descrever e sumarizar um conjunto de dados.

Diferença para a estatística inferencial:

Enquanto a estatística descritiva se limita a resumir e apresentar os dados, a estatística inferencial busca fazer afirmações sobre uma população com base em informações de uma amostra.

O que aprenderemos

🔹 Medidas de tendência central

  • Média simples
  • Moda
  • Mediana

🔹 Separatrizes

  • A própria Mediana
  • Quartis
  • Decis
  • Percentis ou Centis

🔹 Medidas de dispersão

  • Variância
  • Desvio-padrão
  • Erro-padrão
  • Intervalo de Confiança

🔹 Escore Z

  • Transformação em unidades de desvio-padrão
  • Interpretação de probabilidades (68%, 95%, 99,7%)

I. Medidas de Posição (Tendência Central)

Objetivo e Dados de Exemplo

Objetivo

Encontrar um valor que resuma a variabilidade de um conjunto de dados, ou seja, um único número que represente o “centro” da distribuição.

Exemplo de Pesquisa

Investigação dos níveis de crescimento radicular de plantas frente ao uso de fungos micorrízicos arbusculares.

Detalhes da amostra:

  • Tamanho: N = 17
  • Instrumento: 17 amostras independentes
  • Variável: Comprimento da raiz (cm)
  • Variação: 34 cm a 170 cm

1.1 — Criando os Dados de Exemplo

1.2 — Média

A média representa o valor central de um conjunto de dados.

\[\bar{x} = \frac{\sum x_i}{n}\]

1.3 — Moda

A moda é o valor que ocorre com maior frequência no conjunto.

\[Moda = x_i \;|\; \max(frequência(x_i))\]

Podendo ser:

  • Unimodal: 2, 3, 3, 4, 5 → Moda = 3
  • Bimodal: 2, 3, 3, 4, 4, 5 → Modas = 3 e 4
  • Amodal: 2, 3, 4, 5, 6 → Nenhum valor se repete

1.4 — Mediana

A mediana divide os dados ordenados em duas metades iguais.

\[Mediana = \begin{cases} x_{\frac{n+1}{2}}, & n \text{ ímpar} \\ \frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2}, & n \text{ par} \end{cases}\]

II. Medidas de Dispersão

Objetivos

  • Quantificar a variabilidade: escores concentrados ou espalhados?
  • Interpretar semelhanças e diferenças: heterogeneidade vs. homogeneidade
  • Comparar grupos: variabilidade semelhante?
  • Detectar outliers: valores muito afastados da média
  • Apoiar a tomada de decisão: dados com pouca dispersão são mais previsíveis

Principais Medidas

  • Variância (\(s^2\))
  • Desvio-Padrão (\(s\))
  • Erro-Padrão (EP)

1.5 — Variância

A variância mede a dispersão dos valores em relação à média.

\[s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}\]

2.1 — Desvio-Padrão

O desvio-padrão é a raiz quadrada da variância, expresso na mesma unidade dos dados.

\[s = \sqrt{s^2}\]

2.2 — Erro-Padrão

O erro-padrão estima a variabilidade da média amostral.

\[EP = \frac{s}{\sqrt{n}}\]

2.2 — Escore Z

O escore Z indica a posição de cada valor em unidades de desvio-padrão.

\[Z_i = \frac{x_i - \bar{x}}{s}\]

2.3 — Intervalo de Confiança

O intervalo de confiança indica a faixa onde a média populacional provavelmente se encontra.

\[IC = \bar{x} \pm Z_{\alpha/2} \times EP\]

2.4 — Visualização

Obrigado!

Luiz Diego Vidal Santos

Universidade Federal de Sergipe

diego@academico.ufs.br